AI资讯新闻榜单内容搜索-LLM

Legora、Mercor 都在用，Reducto 能成为独立的 LLM 数据入口吗？

Reducto 在去年 6 个月内接连完成分别由 Benchmark 与 a16z 领投的两轮融资，估值翻了 3 倍，达到 6 亿美元。我们认为，Reducto 切中了 AI 应用走向生产环境过程中的“精确数据摄取”瓶颈。

来自主题: AI资讯

10170 点击 2026-03-14 08:41

32B逆袭GPT-5.2：首个端到端GPU编程智能体框架StitchCUDA问世

现有的 LLM 自动化 CUDA 方法大多只能优化单个 Kernel，面对完整的端到端 GPU 程序（如整个 VisionTransformer 推理）往往束手无策。

来自主题: AI技术研报

8660 点击 2026-03-05 14:28

字节杀疯了！豆包 Seed 2.0 专家模式已上线

我天！感觉 Seed 1.8 发布还没多久，没想到 Doubao-Seed-2.0 这么快就杀到了…今天发都算是晚讯了。据官方介绍，这次 Seed 2.0 多模态理解能力全面升级，还强化了 LLM 与 Agent 能力，模型在真实长链路任务中可以稳定推进。

来自主题: AI资讯

10878 点击 2026-03-02 23:22

大语言模型真的会「推理」吗？一项系统性研究梳理 LLM 的结构性推理失败

近期发表于 TMLR 的论文《Large Language Model Reasoning Failures》对这一问题进行了系统性梳理。该研究并未围绕 “模型是否真正理解” 展开哲学层面的争论，而是采取更加务实的路径 —— 通过整理现有文献中的失败现象，构建统一框架，系统分析大语言模型的推理短板。

来自主题: AI技术研报

9210 点击 2026-02-26 10:52

ICLR2026 Oral | 当情感识别不再是分类题：EmotionThinker 让 SpeechLLM 学会“解释情绪”

SpeechLLM 是否具备像人类一样解释 “为什么” 做出情绪判断的能力？为此，研究团队提出了EmotionThinker—— 首个面向可解释情感推理（Explainable Emotion Reasoning）的强化学习框架，尝试将 SER 从 “分类任务” 提升为 “多模态证据驱动的推理任务”。

来自主题: AI技术研报

9180 点击 2026-02-25 14:28

一个模型统一所有离线任务！微软用671B大模型重构广告推荐「推理大脑」

近日，微软Bing Ads与DKI团队发表论文《AdNanny: One Reasoning LLM for All Offline Ads Recommendation Tasks》，宣布基于DeepSeek-R1 671B打造了统一的离线推理中枢AdNanny，用单一模型承载所有离线任务。这标志着从维护一系列任务特定模型，转向部署一个统一的、推理中心化的基础模型，从

来自主题: AI技术研报

9756 点击 2026-02-18 13:29

登顶Hugging Face论文热榜，LLM重写数据准备的游戏规则

来自上海交通大学、清华大学、微软研究院、麻省理工学院（MIT）、上海 AI Lab、小红书、阿里巴巴、港科大（广州）等机构的研究团队，系统梳理了近年来大语言模型在数据准备流程中的角色变化，试图回答一个业界关心的问题：LLM 能否成为下一代数据管道的「智能语义中枢」，彻底重构数据准备的范式？

来自主题: AI技术研报

9060 点击 2026-02-09 11:12

延迟下降20×，token减少4.4×！突破多智能体「共识」瓶颈

过去一年，LLM Agent几乎成为所有 AI 研究团队与工业界的共同方向。OpenAI在持续推进更强的推理与工具使用能力，Google DeepMind将推理显式建模为搜索问题，Anthropic则通过规范与自我批判提升模型可靠性。

来自主题: AI技术研报

10732 点击 2026-02-07 14:04

思维链太长拖慢推理？把它「画」进隐空间！新框架RoT探索大模型隐空间推理新范式

在 LLM 时代，思维链（ CoT）已成为解锁模型复杂推理能力的关键钥匙。然而，CoT 的冗长问题一直困扰着研究者——中间推理步骤和解码操作带来了巨大的计算开销和显存占用，严重制约了模型的推理效率。

来自主题: AI技术研报

8024 点击 2026-01-27 16:17

R1一周年，DeepSeek Model 1悄然现身

2025 年 1 月 20 日，DeepSeek（深度求索）正式发布了 DeepSeek-R1 模型，并由此开启了新的开源 LLM 时代。在 Hugging Face 刚刚发布的《「DeepSeek 时刻」一周年记》博客中，DeepSeek-R1 也是该平台上获赞最多的模型。

来自主题: AI资讯

11331 点击 2026-01-21 09:51